PDF Extractor SDK a Windows szoftverfejlesztők számára: PDF-formátum, PDF-XML, Képek PDF-ből, PDF-információk olvasása, PDF CSV-fájlok Excel-hez.
A Bytescout PDF Extractor SDK lehetővé teszi, hogy a PDF-t PDF, PDF formátumban XML-be, PDF-CSV-be konvertálja, PDF-ből kivágja a képeket, és a PDF-fájlokról a .NET és ActiveX felületeken információkat nyer további szoftver nélkül.
Előnyök:
a PDF-t egyszerű szöveggé alakítja (és oszlopokat követhet, ha újságot készít PDF formátumban) - beleértve a láthatatlan szövegkivonást is;
táblázatokat PDF formátumban Excel-be (CSV) alakít át az adott téglalapból származó cellák olvasásával;
átalakítja a táblázatokat PDF formátumban XML fájlokká;
kivonatolja a PDF fájl metaadatait (cím, szerző, leírás), és kap egyéb információkat a fájlról (oldalszám, titkosított vagy nem);
kivonatolja a beágyazott képeket PDF dokumentumból (ASP.NET, VB.NET, C #, VB6 és VBScript);
DocumentMerger és DocumentSplitter interfészek és osztályok a PDF dokumentumok egyesítéséhez és megosztásához;
nem szükséges az Adobe Reader vagy bármely más PDF-olvasó szoftver telepítése;
.NET és ActiveX interfészeket biztosít;
100% menedzselt C # kóddal készült.
Újdonság ebben a kiadásban:
9.0.0.3079-es verzió: A kibontott tartalom szűrése a betűnév, a betűméret és a szín alapján.
Frissített OCR-motor a legújabb verzióra. A nyelvi fájlok frissítése a "tessdata" mappából.
Továbbfejlesztett szövegkivonás, táblázatos adatok csoportosítása, teljesítmény, XFA formátumkivonás, TableDetector, rögzített PDF-elemzési problémák.
Az újdonság a 8.7.0.2980 verzióban:
Hozzáadott szűrés a kibontott tartalom betűnevével, betűméretével és színével.
Frissített OCR-motor a legújabb verzióra. A nyelvi fájlok frissítése a "tessdata" mappából.
Továbbfejlesztett szövegkivonás, sorok csoportosítása táblázatos adatokban, teljesítmény, XFA formátumkivonás, TableDetector, rögzített PDF-elemzési problémák.
Az újdonság a 8.6.0.2911 verzióban:
Hozzáadott szűrés a kibontott tartalom betűnevével, betűméretével és színével.
Frissített OCR-motor a legújabb verzióra. A nyelvi fájlok frissítése a "tessdata" mappából.
Továbbfejlesztett szövegkivonás, táblázatos adatok csoportosítása, teljesítmény, XFA formátumok kitermelése, TableDetector, rögzített PDF-elemzési problémák.
Az újdonság a 8.2.0.2699 verzióban:
A 8.2.0.2699 verzió nem tartalmazhat frissítéseket, fejlesztéseket vagy hibajavításokat.
Az újdonság a 8.0.0.2528 verzióban:
Újdonság a 7.0.0.2474 verzióban:
7.0.0.2474 verzió:
- hozzáadott egy új DocumentPrinter segédprogramot, amely lehetővé teszi a PDF dokumentumok csendes nyomtatását (felhasználói párbeszédpanelek nélkül)
- új JSONExtractor osztályt adott hozzá
- hozzáadott felülbírálást a DocumentSplitter.Split () metódusra, amely lehetővé teszi a generált fájlok kimeneti mappájának meghatározását
- Fix többszálú hiba a DocumentSplitterben
- tableDetector most tiszteli a SetExtractionArea () metódus által meghatározott extrakciós területet
- új tulajdonságok extrakciós osztályokban: ExtractionColumns - az észlelt oszlopok koordinátáit tartalmazza; CustomExtractionColumns - felülbírálja az oszlopfelismerést
- GetPageRect * módszerek nem vette figyelembe az oldal forgatását.
A telepítőben végrehajtott hiba a korábbi telepítésből származó fájlok miatt nem érinti a frissítéseket - átdolgozta a regisztráció ellenőrzését. Most a könyvtár nem fog kivetni a kivételt, de demo módban dolgozik, ha hiányzik vagy beírja a RegistrationName és RegistrationKey hibás bejegyzéseket
- PDF Multitool: Hozzáadta a legutóbbi dokumentumlistát a "PDF dokumentum megnyitása" gombra
- PDF Multitool: A kijelölés most átméretezhető
- PDF Multitool: Hozzáadott kivonat JSON funkció
- PDF Multitool: javított asztali detektoros felhasználói felület
- PDF Multitool: Nagymértékben javított betűtípus-megjelenítési minőség
- PDF Multitool: Hozzáadott hibakeresési opció "Az észlelt kitömörítési oszlopok megjelenítése" a helyi menüben az észlelt oszlopok megjelenítéséhez az aktuális oldalon. Csak akkor jelenik meg láthatóvá, ha az aktuálisan megjelenített oldalon ellenzi a kivonást
- PDF Multitool: Fix betűtípus-megjelenítési probléma 32 bites Windows rendszeren
- egyéb kisebb javítások és hibajavítások
Újdonság a 6.30.0.2421:
Verzió 6.30.0.2421 verzióban:
- Hozzáadott TextComparer segédprogram osztály (elérhető csak a .NET 4.0 rendszerekben), lehetővé téve a szöveg két PDF dokumentumban való összehasonlítását és jelentést generálhat.
- Az ICC színprofilok jobb támogatása.
- A beágyazott betűtípusok importált kezelése.
- Javított csatolásExtractor.
- Fix XMLExtractor.SaveXMLToStream () módszer.
- Fix kivonatolt szöveges másolás az OCRCacheMode.WholePage opció használatakor.
- Egyéb hibajavítások és javítások.
Újdonság a 6.20.2354 verzióban:
6.20.2354 verzió:
- PDF szöveghez, PDF CSV-hoz, PDF-hez Az XML-funkciók javítása
- Új kivonat videó, kivonat audio példák
- A CSV és az XML extruderek javították a üres oszlopokkal rendelkező táblázatok támogatását
- új MultimediaExtractor a video és audio PDF-ből való kivonásához
- új tulajdonság PageDataCaching
- új "MemoryCareProcessingOfHugeFiles" példa
- fix null kivétel, amikor eldobja a már elhelyezett oldalakat
- XLSExtractor: javítja a betűtípusok támogatását
- A SkipInvisibleText most átugorja a vágott szöveget (ami nem látható)
- a szöveges megjelenítés javítása
- XFDF Extractor: a jelölőnégyzetekhez hozzáadott támogatás
- A képek továbbfejlesztése több alformátumot támogat
- A Unicode szövegkezelése javult
Az újdonság a 6.11.2149 verzióban:
6.11.2149 verzió:
- A kötegelt feldolgozási minták frissítve jelennek meg a Reset () módszer használatával
- C ++ forráskód-minta hozzáadva az Oldalak kitöltéséhez
- A DocumentMerger a Merge2 (inputfile1, inputfile2, outputfile) metódust két fájl egyesítéséhez
- XLS Extractor kisebb hibajavítások
- A PDF Multitool lehetővé teszi a szöveg, a kép, a vektorrétegek engedélyezését / letiltását,
- XML, CSV, táblázatkivonat javítja az emtpry cellák oszlopain belüli táblák támogatását
- .ExtractShadowLikeText tulajdonság javult: jobb szűrés árnyékszerű szöveghez
Az újdonság a 6.10.2136 verzióban:
6.10.2136 verzió:
- PDF-XML, PDF CSV, PDF A szöveges funkciók javultak
- PDF A XLS parancssori minta hozzáadásához (vbscript alapján)
- A PDF HTML SDK új, .DetectHyperLinks tulajdonságot (TRUE alapértelmezés szerint) ad hozzá az automatikus linkek észleléséhez a szövegben
- új SearchablePDFMaker (PRO licencekhez), amelyek PDF konvertálását kereshető PDF fájlokká alakítják
- új tulajdonságok az extraktorban: ConsiderFontNames, ConsiderFontSizes, ConsiderFontColors, ConsiderVerticalBorders a CFG fájlokban
- fejléc oszlopok felderítése (amikor AutoAlighHeaderToColumns = true) javult
- .DetectLinesInsteadOfParagraphs helyébe új .LineGroupingMode tartozik, annak ellenőrzésére, hogy a vonalak hogyan illeszthetők be a bekezdésekbe
- FONTOS! PDF Az XML javítja a hosszú idejű hibát Y-koordinátával a szövegobjektumokhoz (a bal felső sarokban a bal felső sarok helyett)
- .TableXMinIntersectionRequiredInPercents és .TableYMinIntersectionRequiredInPercents tulajdonságok hozzáadva
- Hozzáadott C + + forráskódmintát
- Az XML Extractor a hiányzó üres oszlopokat rögzíti a PreserveFormatting = true módban
- kisebb PDF-fájlokban lévő színes javítások
- több OCR nyelv hozzáadásának támogatása
- PDF Multitool GUI: a Másolás a vágólapra gombra kattint a TXT, a CSV, az XML és a raszteres renderelő párbeszédpanelekhez
- XLSExtractor: a PageToWorksheet tulajdonság hozzáadásával engedélyezi / tiltja különálló munkalapok létrehozását oldalanként
- új .TextEncodingCodePage tulajdonság
- PDFViewerControl: hozzáadja a ValidateContextMenu programot, amely lehetővé teszi a felhasználók számára, hogy egyedi elemeket adjanak hozzá a helyi menühöz
- PDF Viewer vezérlő: tulajdonságok hozzáadása ShowTextObjects, ShowImageObjects, ShowVectorObjects
- Az XMLExtractor az "OCRConfidence" attribútumot hozzáadja az elismert szöveghez
- PDF / A ellenőrzési funkció (béta verzióban)
- javítja az ellenőrzéseket, a szövegellenőrzést és az eredeti elrendezés szerinti igazítást. A kérdést az Y koordináták vezérlésekben történő elmozdulása okozta elemzés közben: ez helytelen volt. A helyes módja annak, hogy ...
- Az XML Extractor frissítve: jelenleg a CONTROL címkét állítja be a jelölőnégyzetek és a szövegmezők számára
- megváltozott az aktuális könyvtárban a temp könyvtár használatával
- jelölőnégyzetek, rádióboxok, szerkesztődobozok, kombinált vezérlőegységek jobban támogatottak
- most lehetővé teszi a részleges bizalmi hívókat
Az újdonság az 5.80.1781 verzióban:
5.80.1781-es verzió:
- PDF-XML, PDF-CSV, PDF-fájlok frissítése a szöveges funkciókhoz
- Az OCRMode most 9 módot kínál
- .DetectLineInsteadOfParagraph most jobban működik. Állítsa False-ra, hogy több táblázatos cellában rögzítse a szöveges szöveget!
- A PDF-vezérlők támogatása javult
- FDF és XFDF adatok kitermelése
Az újdonság az 5.10.1747 verzióban:
5.10.1747 verzió:
- PDF-XML, PDF-CSV, PDF-Szöveges funkciók javítva
- mostantól támogatja a szövegbevezetést a szöveges vezérlőktől
- Az XML extraszter mostantól a betűstílus, a méret, a név, a szövegkoordináták címkékhez ad hozzá
- Hozzáadott ASP.NET minta az OCR használatához
- új tulajdonság OCRLanguageDataFolder a "tessdata" mappa helyének meghatározásához
- javult a PDF fájlok támogatása
- javítja a forgatott szövegek támogatását
- frissített forráskódminták
- frissített dokumentáció
- kisebb fejlesztések és javítások
Újdonság az 5.00.1626 verzióban:
5.00.1626 verzió:
- Hozzáadott szövegfelismerés (szövegből a képekből): most be lehet ágyazni a szöveget a beágyazott képekből és javítani a sérült szöveget
- A CSV- és XML-extruderrel rögzített probléma bizonyos utolsó beállításokból hiányzik
- javult a sérült PDF fájlok támogatása
- többszöri keresőszöveg-keresés szó szerinti illesztési módokkal támogatott
- most szöveges kötőjellel és különböző sorokkal kereshet szöveget: lásd az új forráskódot.
- új tulajdonság .RTLTextAutoDetectionEnabled (alapértelmezés szerint hamis) az RTL nyelvek automatikus felderítésére
- A PDF Viewer GUI bemutatója javult
- kisebb fejlesztések és javítások
Követelmények :
strong>:
Nag képernyő, vízjel a kimeneten
Hozzászólás nem található